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Storsiqnalabhanqiae adaptive Echounterdruckunq 



Die Erfindung betrifft ein Verfahren zur Reduktion von Echosignalen bei 
Telekommunikations (=TK)-Systemen fur die Ubertragung von akustischen 
Nutzsignalen, insbesondere menschlicher Sprache, bei dem das Vorliegen von 
Echosignalen detektiert und/oder vorhergesagt wird und anschliefiend die 
detektierten bzw. vorhergesagten Echosignale unterdruckt oder reduziert 
werden. 



Ein solches Verfahren ist beispielsweise bekannt aus der DE 42 29 912 A1 . 

Die Echo- und Gerauschunterdriickung gewinnt zunehmend an Bedeutung fur 
die Sprachqualitat in Nachrichtennetzwerken, bei denen eine 
Telefonubertragung durch Leitungsechos oder akustische Echos sowie durch 
Hintergrundgerausche oft empfindlich gestort wird. 

Schnurlqse Telefone, insbesondere mobile Telefone finden immer grofiere 
Verbreitung. Um bei standig kleineren Abmessungen der Gerate und damit 
zunehmender akustischer Kopplung vom Lautsprecher auf das Mikrofon eine 
vernunftige Qualitat der Kommunjkation zu erreichen, besitzen diese Gerate 
regelmafiig Einrichtungen zur Kompensation akustischer Echos. Die Technik 
der adaptiven Filter zur Echokompensation ist beispielsweise beschrieben in 
der DE 44 30 189 A1. 

Bei alteren Mobiltelefonen oder technisch einfach aufgebauten biiligeren neuen 
Handys jedoch werden immer noch erhebliche akustische Echos erzeugt, die in 
das PSTN (=Public Switched Telephone Network) gelangen und dort die 
Kommunikation mit anderen festen oder mobilen TK-Teilnehmern sehr 
erschweren. Die Mobilfunkbetreiber sind daher bestrebt, diese Echos zu 
eliminieren, um mit dem Argument einer besseren Tonqualitat gegenuber 
Wettbewerbern neue Kunden zu werben. 

Da in den billigen Mobiltelefonen die akustischen Echos entstehen, aber nicht 
vollstandig unterdruckt werden, bleibt den Netzbetreibern in der Regel nichts 
anderes ubrig, als zu versuchen, die Echos in der nachsten Vermittlungsstelle 
zu unterdriicken. Mit ublichen adaptiven Filtern wird ein Leitungsecho 
modelliert, das bei richtiger Einstellung des Filters die tatsachlich auftretenden 
Echos nachbildet. Sodann wird das modellierte Leitungsecho vom 
echobehafteten TK-Signal subtrahiert. Die Technik der adaptiven Filter kann 
jedoch bei Echos von Handys nicht erfolgreich eingesetzt werden, weil die 
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originale Sprache in Richtung zum Handy sprachcodiert wird und das Echo inn 
Handy nochmals einer Sprachcodierung unterworfen wird. Daher eignen sich 
fur die Unterdruckung von akustischen Handy-Echos nur neuere, nicht lineare 
Verfahren wie beispielsweise "Center Clipper", gesteuerte Dampfungsglieder 
oder NLP. Fur akustische Echos von festen Telefonen sind adaptive Filter 
geeignet, aber in der Regel relativ aufwendig. 

Mit der Einfuhrung von Echo- und Gerauschreduktionsverfahren wurde die 
Starke der Beeinflussung von Sprachsignalen in den Verfahren zunachst nicht 
beriicksichtigt. Zum Beispiel wurde eine Spektralsubtraktion mit 
grofitmoglichem Gewinn betrieben bzw. der Grad einer Echo- und 
Gerauschreduktion wurde auf moglichst hohe Werte eingestellt, um bei einem 
vernunftigen mittleren Storabstand einen moglichst guten Horeindruck zu 
erzeugen. Alle diese Verfahren erzeugen aberdeutlich horbare Storungen bei 
schlechtem Signal-Storabstand oder bei schwachen Nutzsignalen. 

Besonders nachteilig erweist es sich bei den bekannten Verfahren, dass bei 
starkerem, deutlich horbarem Gerausch und gleichzeitig grofier 
Echoabsenkung in das Hintergrundgerausch aufgrund der Echounterdruckung 
bei auftretenden kurzzeitigen Echospitzen "Locher" in das ansonsten 
gleichmafiige Hintergrundgerausch "gestanzt" werden, was zu einer als 
unangenehm empfundenen Modulation des ubertragenen TK-Signals in den 
Sprachpausen fuhrt. 

Aufgabe der vorliegenden Erfindung ist es demgegenuber, ein Verfahren mit 
den eingangs beschriebenen Merkmalen vorzustellen, bei dem moglichst 
unaufwendig und mit einfachsten Mitteln eine Reduktion der Echosignale in der 
Weise durchgefuhrt werden kann, dass ein fur das menschliche Ohr moglichst 
angenehm klingender akustischer Gesamteindruck des ausgesendeten TK- 
Signals erzeugt wird. 



ErfindungsgemafJ wird diese Aufgabe auf ebenso einfache wie wirkungsvolle 
Art und Weise dadurch gelost, dass der Leistungswert des Gerauschpegels N 
im aktuell benutzten TK-Kanal fortlaufend gemessen und/oder geschatzt wird, 
und dass in Abhangigkeit vom aktuellen Gerauschpegel N laufend der Grad der 
aktuell vorzunehmenden Reduktion der Echosignale nach einer vorgegebenen 
Funktion h(N) automatisch eingestellt wird. 

Damit wird der Grad einer Echoabsenkung bzw. Echounterdruckung vorn 
aktuell auftretenden Leistungswert N des Gerausches automatisch mitgesteuert 
und dem aktuellen Gerauschwert im Teliefonkanal angepasst und in 
vorbestimmter definierter Weise nachgefuhrt. Uber die Wahl der Funktion h(N) 
kann auch der subjektive Eindruck des erzeugten Gesamtsignals angepasst 
werden. Ein Auftreten von "Lochern" im Hintergrundgerausch aufgrund einer zu 
starken Echounterdruckung wird durch das erfindungsgemafle Verfahren 
wirkungsvoll vermieden. 

Vorteilhaft wird mit dem erfindungsgemaften Verfahren das eingangsseitige 
Gerauschsignal N multiplikativ mit dem Faktor h(N) auf einen Wert N A reduziert 
gemali der Gleichung N A = N * h(N) . 

Eine bevorzugte Ausfuhrungsform des erfindungsgemafien Verfahrens zeichnet 
sich dadurch aus, dass, die Funktion h(N) mit zunehmendem N ansteigt, wobei 
h(N « 0 dB m ) = h min = const, und h(N « 0 dB m ) = h max > h min . 

Einen psychoakustisch besonders gunstigen Horeindruck der TK-Signale nach 
Durchfuhrung der erfindungsgemafien Echoreduktion erreicht man, wenn 
-50dB < hmm < -20dB, vorzugsweise -45dB < h min < -35dB und 

-20dB < h max < 0 dB, vorzugsweise -12dB < h max < -6dB . 

Besonders bevorzugt ist eine Variante des erfindungsgemafien Verfahrens, die 
sich dadurch auszeichnet, dass die vorgegebene Funktion h(N) eine Funktion 



k(S/N) ist, die vom Rauschabstand, also dem Quotienten S/N aus dem 
Leistungswert des Signalpegels S der zu ubertragenden Nutzsignale und dem 
Leistungswert des Gerauschpegels N abhangt, oderdass die vorgegebene 
Funktion h(N) eine Funktion k'(N/S) ist, die vom Kehrwert N/S dieses 
Quotienten, vorzugsweise von N/(N+S) abhangt. 

Aus Griinden einer einfacheren praktischen Realisierung kann man auch eine 
Funktion von (S+N)/N oder von (S+N)/S verwenden. Besonders praktisch fur 
eine Realisierung des Verfahrens auf einem digitalen Signalprozessor (=DSP) 
ist die Anwendung der Funktion k'[N/(N+S)], die zwischen 0 und 1 veriauft. 

Ein Vorteil der obigen Verfahrensvariante besteht darin, dass bei stark 
variierendem Nutzsignalpegel S in den Telefonkanalen eines Bundels immer 
die richtige Einstellung fur die Echoabsenkung gefunden wird. Bei einer 
Steuerung der Echoreduktion proportional zum Kehrwert N/S bzw. N/(N+S) 
lasst sich die Funktion k' leicht auf einem DSP mit festen Computerwortlangen 
von beispielsweise 16 bit unter Verwendung von besonders einfacher Software 
implementieren, da fur N/S bzw. N/(N+S) vorzugsweise ein Zahlenbereich 0 < 
N/S bzw. N/(N+S) < 1 zur Steuerung der GerSuschreduktion relevant bzw. 
interessant ist. 

Wahrend einer naturlichen Kommunikation zwischen Menschen passt man in 
der Regel die Amplitude der gesprochenen Sprache automatisch an die 
akustische Umgebung an. Bei einer Sprachkommunikation zwischen entfernten 
Orten jedoch befinden sich die Gesprachspartner nicht im selben akustischen 
Umfeld und sind sich daher jeweils nicht der akustischen Situation am Ort des 
anderen Gesprachspartners bewusst Besonders verscharft tritt daher ein 
Problem auf, wenn einer der Partner aufgrund seiner akustischen Umgebung 
gezwungen ist, sehr laut zu sprechen, wahrend der andere Partner in einer 
leisen akustischen Umgebung Sprachsignale mit geringer Amplitude erzeugt. 



Hinzu kommt das Problem, class auf einem TK-Kanal auch ein "elektronisch 
erzeugtes" Gerausch entsteht und als Hintergrund zum Nutzsignal 
mitubertragen wird. Des weiteren ist es auch vorteilhaft, Storsignale wie 
unerwiinschten Hintergrundlarm (Stralienlarm, Fabriklarm, Burolarm, 
Kantinenlarm, Fluglarm etc.) zu reduzieren oder zu unterdrticken. Um den 
Komfort beim Telefonieren zu erhohen, ist man generell bestrebt, jede Art von 
Gerausch mogiichst gering zu halten. 

Vorzugsweise werden daher zusatzlich zur Erkennung und erfindungsgemafJen 
Reduktion von Echosignalen auch Gerauschsignale im TK-Kanal unterdruckt 
oder reduziert. So kann man vorteilhaft eine gehorrichtige Gerauschabsenkung 
mit einer unabhangig davon arbeitenden Echoreduktion verbinden. 

Bei dem bekannten Kompander-Verfahren, wie es beispielsweise in der 
eingangs zitierten DE 42 29 912 A1 beschrieben ist, wird der Grad der 
Gerauschabsenkung gemafi einer fest vorgegebenen Transferfunktion 
festgelegt. 

Der Kompander hat zunachst die Eigenschaft, Sprachsignale mit einem 
bestimmten (vorab eingestellten) "normalen Sprachsignalpegel" (ggf. normale 
Lautstarke genannt) praktisch unverandert von seinem Eingang zum Ausgang 
zu ubertragen. 

Wird nun aberdas Eingangssignal einmal zu laut, z.B. weil ein Sprecher zu 
dicht an sein Mikrofon kommt, so begrenzt ein Dynamik-Kompressor den 
Ausgangspegel auf nahezu den gleichen Wert wie im Normalfall, indem die 
aktuelle Verstarkung im Kompander mit zunehmender Eingangslautstarke linear 
abgesenkt wird. Durch diese Eigenschaft bleibt die Sprache am Ausgang des 
Kompandersystems etwa gleich laut - unabhangig davon wie stark die 
Eingangslautstarke schwankt. 



Wird nun andererseits ein Signal mit einem Pegel, der kleiner als der 
Normalpegel ist, auf den Eingang des Kompanders gegeben, so wird das 
Signal zusatzlich gedampft, indem die Verstarkung zuruckgeregelt wird, urn 
Hintergrundgerausche moglichst nur abgeschwacht zu ubertragen. Der 
Kompander besteht somit aus zwei Teilfunktionen, einem Kompressor fur 
Sprachsignalpegel, die grofier oder gleich einem Normalpegel sind und einem 
Expander fur Signalpegel, die kleiner als der Normalpegel sind. 

Besonders bevorzugt ist eine Variante der obigen Ausfuhrungsform des 
erfindungsgemafJen Verfahrens, bei der in Abhangigkeit vom aktuejjen 
Gerauschpegel N laufend der Grad der aktuell vorzunehmenden Reduktion des 
Gerauschpegels N nach einer vorgegebenen Funktion f(N) oder g(S/N) oder 
g'(N/S), vorzugsweise g'(N/[N+S]) automatisch eingestellt wird. Damit wird der 
Grad der Gerauschabsenkung angepasst an die jeweilige Situation ermittelt und 
zur Steuerung einer Gerauschunterdruckung verwendet. Dies ermoglicht mit 
einfachen Mitteln, einen fur das menschliche Ohr moglichst angenehmen 
akustischen Gesamteindruck zu erzeugen, der je nach Geschmack an 
individuelle Bedurfnisse angepasst werden kann. 

Ein weiterer Vorteil dieser besonders bevorzugten Verfahrensvariante besteht 
darin, dass bei einem Bundel von Telefonkanalen, beispielsweise zwischen 
internationalen Vermittlungsstellen, die Gerauschsituation in jedem einzelnen 
Kanal, die ja von Kanal zu Kanal sehr verschieden sein kann, automatisch 
eingestellt und individuell optimiert werden kann. 

Besonders gute Ergebnisse werden mit dieser Verfahrensvariante einer 
Gerauschreduktion erzielt, wenn die Funktionen f(N), g(S/N), gXN/S) oder 
g'([N/N+S]) bei N « 0 dB m jeweils mit einem konstanten Maximalwert f max bzw. 
g max bzw. g'max « 1 (entsprechend 0 dB) beginnen, im Bereich zwischen N = -15 
dB m bis -10 dB m , vorzugsweise bei N bzw. S/N « -12 dB m , auf einen 
Minimalwert f m in bzw. g m in bzw. g'min abfallen und anschliefiend bis N « 0 dB m 
auf konstanten Wert f 0 > fmin bzw. g 0 > g m in bzw. g' 0 > g'min ansteigen, wobei f 0 , 
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go, g'o < 1 (entsprechend 0 dB), vorzugsweise 0,35 < f 0 , g 0 , g'o < 0,75 (was 
einem Interval! -12 dB < f 0 , go, g'o < -3 dB entspricht). 

Akustische Gehortests haben ergeben, dass bei S/N = 0 dB die Sprache bereits 
so stark gestort ist, dass man das Gerausch nur bedingt um einen Wert fo bzw, 
g 0 zwischen -5 und -10 dB, vorzugsweise zwischen -6 und -8 dB reduzieren 
darf, um den akustischen Gesamteindruck im Hinblick auf eine Naturlichkeit der 
Sprache nichtzu verschlechtern. Bei noch ungunstigeren Werten des Signal- 
zu-Rausch-Verhaltnisses S/N < 0 dB kann dann der Wert f 0 bzw. g 0 beibehalten 
werden, da jede weitere Gerauschabsenkung den Gesamteindruck nur 
verschlechtert. 

Bei mittleren S/N kann gemafi diesen Untersuchungen eine starkere 
Gerauschabsenkung vorgenommen werden. Ein Minimum ergibt sich dabei im 
Bereich 10 dB bis 15 dB. Der Wert der Gerauschabsenkung f min bzw. g min kann 
zwischen -3 dB und -30 dB einstellbar sein und sollte im Maximum zwischen 
-12 dB und -30 dB, vorzugsweise etwa -18 dB betragen. 

Bei sehr guten Signal-zu-Gerauschabstanden S/N > 40 dB sollte nur noch eine 
minimale Absenkung zwischen 0 und -3 dB eingestellt werden, um die 
Naturlichkeit der ubertragenen Sprache so gut wie moglich zu erhalten. Nach 
der ITU-T G.168 fur Echo-Canceller soil ein Rauschen bei S/N > 40 dB 
unverandert belassen werden, was einem numerischen Wert f ma x bzw. g ma x=1 
(entsprechend 0 dB) entspricht. 

Der Klang der Sprache und die Verstandlichkeit sind besonders gut, wenn die 
Funktionen h(N), f(N), k(S/N), g(S/N) bzw. k'(N/S) und g'(N/S) uber die drei 
oben diskutierten Bereiche hinweg in stetiger Weise miteinander 
zusammenhangen, wobei schnelle Anderungen in N oder in S/N vorteilhaft 
durch Filterungen geglattet werden konnen. 



Eine relativ einfache Realisierung in Hardware und/oder Software ergibt sich, 
indem man die genannten Funktionen h(N), f(N), k(S/N), g(S/N) bzw. k'(N/S) 
und g'(N/S) durch gerade Kennlinienstucke zwischen den drei oben 
beschriebenen Betriebspunkten approximiert (abschnittsweise lineare 
Naherung). 

Bei einer etwas aufwendigeren Variante des erfindungsgemalien Verfahrens, 
die aber im Ergebnis zu einem besseren Klangbild fuhrt, wird eine 
Polynomfunktion zur Implementierung der stetigen Funktionen h(N), f(N), 
k(S/N), g(S/N) bzw. k'(N/S) und g'(N/S) in den drei diskutierten Bereichen 
herangezogen, was im Ergebnis zu einer Art unsymmetrischer Glockenfunktion 
fuhrt. 

Fur einen gunstigen Kompromiss zwischen Aufwand und Klangbild kann man 
bestimmte Abschnitte der oben genannten Funktionen durch gerade 
Kennlinienstucke und andere Abschnitte durch eine Polynomialfunktion 
realisieren. 

Besonders bevorzugt ist eine Variante des erfindungsgemafJen Verfahrens, bei 
der die Funktionen h(N), f(N), k(S/N), g(S/N) bzw. k'(N/S) und g'(N/S)_so 
gewahlt werden, dass die Reduktion des Gerauschpegels N gehorrichtig gemafi 
den psychoakustischen Mittelwerten des menschlichen Gehorspektrums erfolgt. 
Dabei wird der Wert fur S und/oder N nicht nur aus dem momentanen 
Leistungswert alleine, sondern auch aus einem gewichteten spektralen Verlauf 
von S bzw. N bestimmt und insgesamt uberdie so gewonnene Funktion eine 
gehorrichtige, d.h. eine psychoakustisch angenehm klingende 
Gerauschreduktion erzielt. Da es kein einfach darstellbares Mafi fur eine 
akustisch angenehm klingende Gerauschreduktion gibt, sind alle 
Qualitatsbeurteilungen auf umfangreiche Gehortests angewiesen, die 
anschliefiend mittels dafur optimierter statistischer Methoden ausgewertet 
werden, urn einen Bewertungsmafistab, (ahnlich wie bei Sprachcodes) zu 
erhalten. 



10 



Eine gute Gerauschpegel-Schatzung erfordert einen guten Sprach-Pausen- 
Detektor, da man nur dann sicher sein kann, dass in den Sprachpausen- 
Abschnitten lediglich storendes Gerausch und nicht irgendeine Mischung 
zwischen Gerausch und Sprachfetzen vorliegt, wie es in der Praxis haufig 
vorkommt. 

Um eine effektive Gerauschreduktion zu erzielen, wird vorzugsweise das zu 
ubertragende Signal wahrend der Sprachpausen in seinem Leistungswert 
gemafi einer Exponentialfunktion abgesenkt. Damit wird bereits eine 
wesentliche Gerauschminderung erzielt. Wahrend der Sprachabschnitte 
werden Gerausche zumindest teilweise durch die Sprache selbst maskiert und 
daher insgesamt weniger wahrgenommen. Hinzu kommt, dass eine Absenkung 
der Gerausche wahrend einer Sprachpause das Gehor deutlich weniger 
belastet, indem es den Taubheitseffekt nach lauter Schalleinwirkung wesentlich 
mindert. Das Ohr kann bei Wiedereinsetzen der Sprache empfindlicher 
reagieren und genauer hinhoren. 

Besonders bevorzugt ist auch eine Verfahrensvariante, die sich dadurch 
auszeichnet, dass im Sprach-Pausen-Detektor aus dem Eingangssignal x 
mittels eines Kurzzeit-Pegelschatzers ein Kurzzeit-Ausgangssignal sam(x), 
mittels eines Mittelzeit-Pegelschatzers ein Mittelzeit-Ausgangssignal mam(x) 
und mittels eines Langzeit-Pegelschatzers ein Langzeit-Ausgangssignal lam(x) 
gebildet wird, dass die drei Ausgangssignale sam(x), mam(x) und lam(x) uber 
geeignete Verstarkungskoeffizienten so eingestellt werden, dass sie etwa gleich 
grofi, wenn das Eingangssignal x ein reines Rauschsignal ist, wobei sam(x) < 
mam(x) < lam(x), dass die drei Ausgangssignale sam(x), mam(x) und lam(x) 
von Komparatoren uberwacht werden, und dass das Vorliegen eines 
Sprachsignals als Eingangssignal x angenommen wird, wenn sam(x) und 
mam(x) zunachst jeweils grofier werden als lam(x), und das Vorliegen einer 
Sprachpause, wenn danach sam(x) und/oder mam(x) wieder kleiner wird als 
lam(x). 
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Mit Hilfe dieser relativ einfachen Arten der Bildung von verschiedenen 
Mittelwerten des Zeitsignals kann bereits eine uberraschend gute 
Sprachpausen-Detektion durchgefuhrt werden, die nureinen sehrgeringen 
Rechenaufwand erfordert. 

Eine Weiterbildung dieser Verfahrensvariante sieht vor, dass 
die drei Ausgangssignale sam(x), mam(x) und lam(x) zur Sprach-Pausen- 
Abschatzung einem neuronalen Netz zugefuhrt werden, das mit einer Vielzahl 
von Szenarien mit unterschiedlichen Eingangssignalen xtrainiert wurde. Ein 
neuronales Netz kann vorteiihaft lineare und nichtlineare Zusammenhange 
zwischen einer groflen Menge von Eingabeparametern und den gewunschten 
Ausgabewerten abbilden. Eine Voraussetzung dafiir ist, dass das neuronale 
Netz einmal mit einer hinreichenden Menge von Eingabewerten und 
zugehorigen Ausgabewerten trainiert wurde. Daher eignen sich neuronale 
Netze besonders fur die Aufgabe einer Sprachpausen-Detektion bei 
Anwesenheit von unterschiedlichen storenden Gerauschen. 

Eine Trennung der Steuerung einer Gerauschreduktion von der einer 
Echoabsenkung ist zweckmafiig, da Gerausche und Echos unabhangig 
voneinander auftreten und auch in der Regel vollig unterschiedliche 
physikalische Ursachen haben. Man kann aber mathematisch eine generelle 
Reduktionsfunktion R angeben, die eine Absenkung von Signalpegeln sowohl 
fur Gerausche als auch fur Echos beschreibt: 

R(S, N, ES, T E , ERL, thrs) - g(S/N) * d(N,ES, x E> ERL, thrs) , 

wobei g(S/N) die oben beschriebene Gerauschreduktion und d(...) die 
unabhangig zusatzlich einsetzende gerauschabhangige Echoabsenkung 
bedeuten, wenn das geschatzte Echosignal den vorgegebenen Schwellwert 
thrs uberschreitet. 
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Besonders vorteilhaft ist eine Verfahrensvariante, bei der wahrend der 
Zeitdauer einer Echo-Red uktion zum Nutzsignal zusatzlich ein kunstliches 
Gerauschsignal addiert wird. Eine Gerauschabsenkung ist bei gleichbleibendem 
Gerauschpegel ebenfalls konstant. Eine plotzlich zusatzlich einsetzende 
Echoreduktion im Rhythmus der Sprache bedeutet auch eine 
Gerauschabsenkung (zumindest in dem kurzen Zeitabschnitt) im 
Sprachrhythmus. Dies fuhrt zu einem gepulsten Hintergrundgerausch, welches 
sich nicht naturlich anhort. Daher ist es vorteilhaft, in den Augenblicken einer 
zusatzlichen Echoreduktion ein synthetisches Gerausch eines geeigneten 
Rauschgenerators in der Grofienordnung des normalen Hintergrundgerausches 
zum bearbeiteten Signal hinzuzufugen. Damit soli ein moglichst 
gleichbleibendes Hintergrundgerausch fur den Horer vermittelt werden. Die 
oben diskutierten "Locher" im Hintergrundgerausch aufgrund der 
Echoabsenkung konnen damit zumindest teilweise "aufgefullt" werden. 

Der Rauschgenerator kann so gestaltet werden, dass das kunstliche 
Gerauschsignal eine psychoakustisch als angenehm empfundene akustische 
Signalsequenz (=comfort noise) umfasst. 

Anstelle eines synthetischen Hintergrundgerausches kann aber auch ein 
Abschnitt eines zuvor aufgezeichneten echten Hintergrundgerausches in 
passender Starke in den Echozeitabschnitten eingefugt werden. Das 
hinzugefugte Gerausch unterscheidet sich dann so gut wie uberhaupt nicht vom 
vorherigen Gerausch und wird daher kaum storende akustische Veranderungen 
beim Horer hervorrufen. Lediglich an den Umschaltsteilen zwischen 
Originalgerausch und hinzugefugtem Gerausch kann es ganz kurz zu 
Unstimmigkeiten kommen. 

Das Hinzufugen von Gerauschen zur akustischen Verdeckung von Effekten 
sowie die Mafinahmen einer getrennten Behandlung von Gerauschen und 
Echos werden, wenn sie richtig aufeinander abgestimmt sind, einen besonders 
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verstandlichen und angenehmen Spracheindruck auch bei "schwieriger" 
Umgebung (Echos plus Gerausche) bewirken. 

In den Rahmen der vorliegenden Erfindung fallt auch eine Servereineit zur 
Unterstutzung des oben beschriebenen erfindungsgemafien Verfahrens sowie 
ein Computerprogramm zur Durchfuhrung des Verfahrens. Das Verfahren kann 
sowohl als Hardwareschaitung, als auch in Form eines Computerprogramms 
realisiert werden. Heutzutage wird eine Software-Programmierung fur 
leistungsstarke DSP's bevorzugt, da neue Erkenntnisse und Zusatzfunktionen 
leichter durch eine Veranderung der Software auf bestehender Hardwarebasis 
implementierbar sind. Verfahren konnen aber auch als Hardwarebausteine 
beispielsweise in TK-Endgeraten oder Telefonanlagen implementiert werden. 

Weitere Vorteile der Erfindung ergeben sich aus der Beschreibung und der 
Zeichnung. Ebenso konnen die vorstehend genannten und die noch weiter 
aufgefuhrten Merkmale erfindungsgemafJ jeweils einzeln fur sich oder zu 
mehreren in beliebigen Kombinationen Verwendung finden. Die gezeigten und 
beschriebenen Ausfuhrungsformen sind nicht als abschlieliende Aufzahlung zu 
verstehen, sondern haben vielmehr beispielhaften Charakter fur die Schilderung 
der Erfindung. 

Die Erfindung ist in der Zeichnung dargestellt und wird anhand von 
Ausfuhrungsbeispielen naher erlautert. 

Die Figur zeigt ein konkretes Ausfuhrungsbeispiel fur die Funktionen 
k'[N/(N+S)] und g'[N/[N+S)]. 

Beispiel: Berechnung eines Paares &(.) und k'M 

i) Die gewunschte Funktion g ( (.)=NLA(.) zur Gerauschabsenkung kann z.B. 
durch Kombination von Geradenstucken mit Stucken einer Polynomfunktion 
beschrieben werden; im einfachsten Fall z.B. mittels eines Polynoms n-ten 
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Grades (2<n<5) und einer Geraden. Der Gerauschreduktionsfaktor NLA (als 
Verstarkungswert) ergibt sich somit gemafi Gleichung (1) : 



(V 



g'C) = 



falls (x= N/(N+S) < -40 dB) dann g'(.) = 1 

falls (-40dB < x=N/(N+S) <-12 dB) dann 

g'(.) = a n x n + a n -i x"' 1 +.. +a 1 x + a 0 (Polynomstuck) 
K falls (-12dB<x= N/(N+S) <0 dB) dann 

g'C) = m x + c (Gerade) 



Die Koeffizienten {a n , a n .i, ...ai, a 0 } des Polynoms sowie die Koeffizienten {m, c} 
der Geraden werden so berechnet, dass sie im gewunschten Punkt A 
zusammentreffen. 



ii) Die zugehorige Funktion der Echodampfung ERLE[N/(N+S)] = k'(.) kann 
ebenfalls z.B. durch Kombination von Geradenstucken mit Stucken einer 
Polynomfunktion beschrieben werden. Sie wird in diesem Beispiel gemali 
Gleichung (2) vorzugsweise aus 2 Geradenstucken zusammengesetzt, die so 
gewahlt sind, dass sie an die jeweilige Situation gut angepasst sind. 



(2) 



k<(.) = 



falls (x=N/(N+S) < -12 dB) 
k'(.) = x 



0,25 



+ /7 



^ falls (-12 dB < x=N/(N+S) < 0 dB) 
k<(.) = g'(x) A 



dann 

mm (Geradenstuck 1) 
dann 

(Geradenstuck 2) 



Dabei bedeuten g'(A) der numerische Wert (real) von g'(.) im Punkt „A", A ein 
Faktor, um den dieser Wert verkleinert wird, damit die Funktion k'(.) parallel im 
Abstand von A zu der Funktion g'(.) verlauft. 
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Nach der Rec. ITU-T G.168 soil ein Gerausch bis zu einem Pegel von -40 dB 
am Eingang eines Echocancellers unverandert, d.h. mit gleichem Pegel, 
ubertragen werden. Diese Funktionalitat wird durch die erste Bedingung fur g'( ) 
gemaR Gl.(1) erfullt. 

Besonders vorteilhaft ist es, wenn in die Lage des Punktes A, die Grofie von 
hmin sowie der Abstand A der beiden Funktionen g' und k' voneinander frei 
wahlbar und entsprechend den konkreten Bedurfnissen im Einzelfall einstellbar 
sind. Bei Verschiebung des Punktes A sollte sich die Funktion k l automatisch an 
die veranderte Funktion g' anpassen. 



1 



Patentanspruche 

1. Verfahren zur Reduktion von Echosignalen bei Telekommunikations 
(=TK)-Systemen fur die Ubertragung von akustischen Nutzsignalen, 
insbesondere menschlicher Sprache, bei dem das Vorliegen von 
Echosignalen detektiert und/oder vorhergesagt wird und 
anschlieflend die detektierten bzw. vorhergesagten Echosignaie 
unterdruckt oder reduziert werden 

dadurch gekennzeichnet, 

dass der Leistungswert des Gerauschpegels N im aktuell benutzten 

TK-Kanal fortlaufend gemessen und/oder geschatzt wird, 

und dass in Abhangigkeit vom aktuellen Gerauschpegel N laufend 

der Grad der aktuell vorzunehmenden Reduktion der Echosignaie 

nach einer vorgegebenen Funktion h(N) automatisch eingestellt 

wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die 
Funktion h(N) mit zunehmendem N ansteigt, wobei h(N « 0 dB m ) = 
h min = const, und h(N » 0 dB m ) = h max > h min . 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass gilt : 
-50dB < h min < -20dB, vorzugsweise -45dB < h min < -35dB und 
-20dB < hmax < 0 dB, vorzugsweise -12dB < h ma x < -6dB . 



Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass die vorgegebene Funktion h(N) eine Funktion 
k(S/N) ist, die vom Rauschabstand, also dem Quotienten S/N aus 
dem Leistungswert des Signalpegels S der zu tibertragenden 
Nutzsignale und dem Leistungswert des Gerauschpegels N 
abhangt, oder dass die vorgegebene Funktion h(N) eine Funktion 
k'(N/S) ist, die vom Kehrwert N/S dieses Quotienten, vorzugsweise 
von N/(N+S) abhangt. 

Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass zusatzlich zur Erkennung und Reduktion von 
Echosignalen auch Gerauschsignale unterdruckt oder reduziert 
werden. 

Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass in 
Abhangigkeit vom aktuellen Gerauschpegel N laufend der Grad der 
aktuell vorzunehmenden Reduktion des Gerauschpegels N nach 
einer vorgegebenen Funktion f(N) oder g(S/N) oder g'(N/S), 
vorzugsweise g'(N/[N+S]) automatisch eingestellt wird. 

Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die 
Funktionen f(N), g(S/N), g'(N/S) oder g ( ([N/N+S]) bei N « 0 dB m 
jeweils mit einem konstanten Maximalwert f max bzw. g max bzw. g' ma x 
« 0 beginnen, im Bereich zwischen N = -15 dB m bis -10 dB m , 
vorzugsweise bei N bzw. S/N « -12 dB m , auf einen insbesondere 
einstellbaren Wert, vorzugsweise einen Minimalwert f min bzw. g min 
bzw. g^in abfallen und anschlieflend bis N « 0 dB m auf konstanten 
Wert f 0 > f min bzw. g 0 > g m in bzw. g'o > g'min ansteigen, wobei f 0 , g 0 , 
g ( o < 0 . 



8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass gilt : 
f 0 < -5dB , g 0 > -10dB, vorzugsweise f 0 < -6dB , g 0 > -8dB. 

9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, dass 
fmin < -20 dB, g min > -30 dB, vorzugsweise f min , g m in ~ -25 dB. 

10. Verfahren nach einem der Anspruche 1 bis 9, dadurch 
gekennzeichnet, dass die Funktionen h(N) und/oder f(N) bzw. k(S/N) 
und/oder g(S/N) bzw. k'(N/S) und/oder g'(N/S) zumindest 
stuckweise, vorzugsweise in alien Teilabschnitten linear mit N bzw. 
S/N bzw. N/S bzw. N/(N+S) verlaufen. 

1 1 .Verfahren nach einem der Anspruche 1 bis 9, dadurch 

gekennzeichnet, dass die Funktionen h(N) und/oder f(N) bzw. k(S/N) 
und/oder g(S/N) bzw. k'(N/S) und/oder g ( (N/S) aus Polynomen 
aufgebaut sind und als unsymmetrische Glockenkurven uber N bzw. 
S/N bzw. N/S verlaufen. 

12. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass die Funktionen h(N) und/oder f(N) bzw. k(S/N) 
und/oder g(S/N) bzw. k^N/S) und/oder g'(N/S) so gewahlt werden, 
dass die Reduktion des Gerauschpegels N gehorrichtig gemafi den 
psychoakustischen Mittelwerten des menschlichen Gehorspektrums 
erfolgt. 



13. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass zur Erkennung des Gerauschpegels N ein 
Sprach-Pausen-Detektor (SPD) eingesetzt wird. 

14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass das zu 
ubertragende Signal wahrend der Sprachpausen in seinem 
Leistungswert gemafi einer Exponentialfunktion abgesenkt wird. 

15. Verfahren nach Anspruch 13 oder 14, dadurch gekennzeichnet, 
dass im Sprach-Pausen-Detektor (SPD) aus dem Eingangssignal x 
mittels eines Kurzzeit-Pegelschatzers ein Kurzzeit-Ausgangssignal 
sam(x), mittels eines Mittelzeit-Pegelschatzers ein Mittelzeit- 
Ausgangssignal mam(x) und mittels eines Langzeit-Pegelschatzers 
ein Langzeit-Ausgangssignal lam(x) gebildet wird, 

dass die drei Ausgangssignale sam(x), mam(x) und lam(x) uber 
geeignete Verstarkungskoeffizienten so eingestellt werden, dass sie 
etwa gleich groli, wenn das Eingangssignal x ein reines 
Rauschsignal ist, wobei sam(x) < mam(x) < lam(x) , 
dass die drei Ausgangssignale sam(x), mam(x) und lam(x) von 
Komparatoren uberwacht werden, 

und dass das Vorliegen eines Sprachsignals als Eingangssignal x 
angenommen wird, wenn sam(x) und mam(x) zunachst jeweils 
grofier werden als lam(x), und das Vorliegen einer Sprachpause, 
wenn danach sam(x) und/oder mam(x) wieder kleiner wird als 
lam(x). 

16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass die 
drei Ausgangssignale sam(x), mam(x) und lam(x) zur Sprach- 
Pausen-Abschatzung einem neuronalen Netz zugefuhrt werden, das 



mit einer Vielzahl von Szenarien mit unterschiedlichen 
Eingangssignalen x trainiert wurde. 



17. Verfahren nach einem der Anspruche 5 bis 16, dadurch 
gekennzeichnet, dass die Steuerung der Reduktion von 
Gerauschsignalen und der Reduktion von Echosignalen getrennt 
erfolgt. 

18. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass wahrend der Zeitdauer einer Echo-Reduktion 
zum Nutzsignal zusatzlich ein kunstliches Gerauschsignal addiert 
wird. 

19. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass das 
kunstliche Gerauschsignal eine psychoakustisch als angenehm 
empfundene akustische Signalsequenz (=comfort noise) umfasst. 

20. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass das 
kunstliche Gerauschsignal ein zuvor wahrend der aktuellen TK- 
Verbindung aufgezeichnetes Gerauschsignal umfasst. 

21.Servereinheit zur Unterstutzung des Verfahrens nach einem der 
Anspruche 1 bis 20. 



22.Computerprogramm zur Durchftihrung des Verfahrens nach einem 
der Anspruche 1 bis 20. 
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Zusammenfassunq 



Ein Verfahren zur Reduktion von Echosignalen bei Telekommunikations 
(=TK)-Systemen fur die Ubertragung von akustischen Nutzsignalen, 
insbesondere menschlicher Sprache, bei dem das Vorliegen von Echo- 
signalen detektiert und/oder vorhergesagt wird und anschlieflend die 
detektierten bzw. vorhergesagten Echosignale unterdruckt oder redu- 
ziert werden, ist dadurch gekennzeichnet, dass der Leistungswert des 
Gerauschpegels N im aktuell benutzten TK-Kanal fortlaufend gemessen 
und/oder geschatzt wird, und dass in Abhangigkeit vom aktuellen 
Gerauschpegel N laufend der Grad der aktuell vorzunehmenden 
Reduktion der Echosignale nach einer vorgegebenen Funktion h(N) 
automatisch eingestellt wird. Damit kann unaufwendig und mit ein- 
fachsten Mitteln eine Reduktion der Echosignale in der Weise durch- 
gefuhrt werden, dass ein fur das menschliche Ohr moglichst angenehm 
klingender akustischer Gesamteindruck des ausgesendeten TK-Signals 
erzeugt wird, wobei gegenuber dem Stand der Technik der Nachteil 
vermieden wird, dass bei starkerem, deutlich horbarem Gerausch und 
gleichzeitig grolier Echoabsenkung in das Hintergrundgerausch auf- 
grund der Echounterdruckung bei auftretenden kurzzeitigen Echo- 
spitzen "Locher" in das ansonsten gleichmafiige Hintergrundgerausch 
"gestanzt" werden, was bei den bekannten Verfahren zu einer als 
unangenehm empfundenen Modulation des ubertragenen TK-Signals in 
den Sprachpausen fuhrt. 
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